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Аппарат аппроксимации в составе 
программного обеспечения суперкомпьютера 
с кластерной архитектурой 


В статье описаны разработанные авторами алгоритмы и программные комплексы наилучшей равномерной 
аппроксимации с обоснованием их преимуществ. Для иллюстрации рассмотрены некоторые примеры 
их эффективного применения на практике, в том числе на суперкомпьютере с кластерной архитектурой. 


Введение 


На современном этапе развития уровень информационного обеспечения является 
одним из определяющих факторов развития экономики, науки, техники, и можно ут- 
верждать, что от количества и качества полученной информации существенно зависит 
эффективность жизнедеятельности общества в целом. 

На практике информация, как правило, представляется в виде массивов числовых 
данных, которые являются дискретным представлением функциональных зависи- 
мостей, характеризующих исследуемые объекты и процессы разной природы. Работа 
с такими массивами связана с рядом серьёзных трудностей, возникающих при их 
использовании, например, в задачах математического моделирования; при восстано- 
влении значений дискретно заданной функции на «неосвещенных» замерами участ- 
ках, а также при хранении и скоростной передаче по каналам связи больших и 
сверхбольших по объему массивов. Для преодоления указанных трудностей применяется 
математическая обработка массивов числовых данных с использованием аппарата 
приближения (аппроксимации) функций с целью сжатия этих массивов путём замены 
дискретного представления функциональных зависимостей аналитическими выраже- 
ниями (аппроксимантами) с небольшим числом параметров-коэффициентов. Степень 
сжатия характеризуется коэффициентом сжатия С, который определяется по фор- 
муле [1]: 


с=ЫУ)/ЬЕ), (1) 


где Ы у ) г ЫЕ ) — число бит, необходимых для хранения функции Г и аппроксиманта РЁ’. 

Качественно новым способом такой замены является способ наилучшей равно- 
мерной (чебышевской) аппроксимации, который значительно эффективнее и универ- 
сальнее интерполяционного и среднеквадратического способов приближения. Главным 
преимуществом чебышевского способа является обеспечение точности приближения, 
полученной на некотором подмножестве точек промежутка аппроксимации, во всех 
точках этого промежутка. Кроме того, наилучшее равномерное приближение даёт 
лучшую точность аппроксимации по сравнению с наилучшим среднеквадратическим 
приближением аппроксимантами тех же классов. 
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В Институте кибернетики разработаны интеллектуализированные методы, алго- 
ритмы и программные комплексы построения наилучших чебышевских аппроксимантов 
разных классов (полиномы, дробно-рациональные, экспоненциальные, логарифмические 
выражения и др.) [2-5]. Разработаны также алгоритмы и программы наилучшего 
кусочно-полиномиального приближения с разбиением массивов на группы элемен- 
тов (сегментная аппроксимация) [6], а также чебышевского приближения функций 
многих переменных [7]. 

Аппарат наилучшей равномерной аппроксимации эффективно используется для 
сжатия больших массивов данных при решении актуальных проблем, связанных с 
расчётом характеристик сложных динамических систем, которые требуют высокой 
точности результатов, а также для решения задач математического моделирования и 
прогнозирования процессов разной природы, в частности, экологических процессов. 

В настоящее время для суперкомпьютера с кластерной архитектурой СКИТ 
Института кибернетики разработаны библиотека программ наилучшей чебышевской 
аппроксимации и библиотека процедур вычисления математических функций с ис- 
пользованием аппарата наилучшей равномерной аппроксимации. В стадии разра- 
ботки в составе программного обеспечения СКИТ находится пакет аппроксимации 
функций, который включает в себя программные комплексы всех способов аппрок- 
симации. Создана также подсистема сжатия больших массивов числовых данных в 
составе Информационно-аналитической системы «Бюджетный комитет» с целью 
прогнозирования основных макроэкономических показателей бюджета Украины и 
обеспечения скоростной передачи по компьютерным сетям файлов размерностью в 
десятки мегабайт. 


Постановка задачи, методы и алгоритмы её решения 


Наилучшим равномерным приближением с весом их) = О для функции Г(х) на 


множестве точек ЕЁ ‚где ЕЁ = [,, В] или Ех = = [,В], называется такой ап- 
проксимант Е” (х; А) из заданного класса функций {Е(х;А)}, А = (2,0 ,..., м, } ип < М, 


для которого выполняется условие 
пах (т) ГЫ [8 4) р’ = т пах|мх) у (+) Е(х; 4] | (2) 


Величина р называется величиной наилучшего равномерного взвешенного при- 
ближения. При их) =1 имеем наилучшее абсолютное, а при их) а (х) — наилуч- 
шее относительное приближение. 

Наиболее известным и эффективным методом построения наилучшего равномер- 
ного приближения является метод последовательных чебышевских интерполяций (п.ч.и) 
Ремеза, который первоначально был разработан для случая аппроксимации полино- 


п 
мами Р, (х)=У ах, а затем распространён и на ряд других случаев [8]. Теоретической 
1=0 
основой метода п.ч.и. является теорема Чебышева, в соответствии с которой поли- 
ном наилучшего приближения характеризуется таким необходимым и достаточным 


условием чебышевского альтернанса: на множестве точек Еу < [©,В] существуют 


по крайней мере п+2 точки @ < <х <...<х,.| <В, в которых уклонение функ- 


п-1 
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ции от аппроксиманта А(х)= их)[ р: (х)-Р, (х)] достигает своего модуль-максимума 


И 


р с чередованием знака. Тогда Р, (х) — полином наилучшего приближения, а {х, 


чебышевский альтернанс. 
Метод Ремеза является итерационным и заключается в построении последова- 


> ео): 30) (7 Е 

тельности (п +2) точечных наборов 5’, = | о 
дящейся к чебышевскому альтернансу. При этом на каждом /-м шаге и+1 коэф- 
фициент текущего аппроксиманта Р, , (х) и погрешность приближения р; определяются 


из системы линейных уравнений 
(7). 1:0) Р, (= (Стр, = 
меб) |5) р, 6] = (-1Ур,, 2=0,мз. (3) 
Фактическая скорость сходимости п.ч.и. зависит, в основном, от различных спо- 
собов замены наборов 5 ,, а именно — допустимого, полуоптимального и оптимального 


соответственно с такими скоростями сходимости: линейной, геометрической прогрес- 
сии и квадратической. В разработанных авторами алгоритмах, базирующихся на 
методе п.ч.и., реализуется предложенный в работе [9] полуоптимальный (на 
практике совпадающий с оптимальным) способ замены наборов точек 5,, квадрати- 


ческая скорость сходимости которого обеспечивает нахождение наилучшего аппрок- 
симанта, как правило, всего за 1 — 2 итерации, в то время как при других способах 
замены число итераций во много раз больше [8]. 

Ниже приводятся краткие описания разработанных в Институте кибернетики 
алгоритмов наилучшей чебышевской аппроксимации для функций как одной, так и 
многих переменных. Алгоритмы основаны на методе п.ч.и. Ремеза. 


Описание алгоритмов аппроксимации 


Алгоритмы п.ч.и. можно применять для аппроксимации как дискретно заданной, 
так и аналитически заданной функции. Во втором случае дополнительно вводится 
процедура вычисления значений функции в точках дискретизации. 

Численная реализация предлагаемых алгоритмов построения наилучших при- 
ближений аппроксимантами различных типов имеет, кроме указанных выше, также 
дополнительные преимущества, связанные с оптимизацией этих алгоритмов по точ- 
ности и быстродействию [3]. Для алгоритмов наилучшей чебышевской аппроксимации и 
соответствующих программных комплексов авторами получены оценки всех видов 
погрешностей, в частности, априорные и апостериорные мажорантные детерминиро- 
ванные оценки полной погрешности, причем неулучшаемые для некоторых классов 
функций [2]. Эти меры оптимизации позволили значительно повысить точность ре- 
зультатов вычислений (в некоторых случаях на порядок). 

В свою очередь алгоритмы аппроксимации функций одной переменной, кроме 
оптимального варианта замены точек наборов 5,, имеют ряд возможностей и пре- 


имуществ по сравнению с алгоритмами п.ч.и. других авторов, а именно, обеспечивают 
построение полиномиального приближения с произвольным весом их) = 0; позво- 
ляют получить более точную оценку величины наилучшего приближения р за счет 


включения в вычислительные схемы алгоритмов расчёта полной погрешности при- 
ближения, а также позволяют находить либо аппроксимант заданной фиксированной 
степени (вход по степени), либо такой аппроксимант, который обеспечивает заданную 
точность приближения (вход по точности). 
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п 
В алгоритме наилучшего чебышевского приближения полиномами вида Р, (х)= уз йе 
1=0 


вычисление значений полинома в точках производится по схеме Горнера, а именно, 


а;| погреш- 


п 


Р (х)= ((. яя (ах т )х + о +а, )х + а. В случаях, когда величина 2" у 
1=0 


ности округления коэффициентов а; в системе с плавающей запятой с т двоичными 


п 
разрядами слишком велика, аппроксимант берётся в виде Р, (х)=У си; (х), где Т(х) — 
1=0 


многочлены Чебышева 1-го рода, а его значения в точках вычисляются по схеме 
Бахвалова [10]. Проведенный анализ показал, что для степеней аппроксимантов не 
выше 10 схемы Горнера и Бахвалова приблизительно равнозначны. 

В случае приближения дробно-рациональными выражениями вида 


т А 
Вик (х)= У ах У 6,7 5 (4) 
1=0 1=0 


в отличие от аппроксимации полиномами, сходимость чебышевских интерполяций 
теоретически доказана только при условии близости начального приближения к наи- 
лучшему аппроксиманту. Поэтому в этом случае применяется подход, объединяющий 
преимущества алгоритма п.ч.и. Ремеза и алгоритма Вернера [11], а именно, высокую 
скорость сходимости первого и сходимость с произвольного начального приближения 
второго. Этот подход был реализован в комбинированном алгоритме [4], в котором 
для получения дробно-рационального аппроксиманта (4) сначала применяется метод 
Ремеза до нарушения его сходимости. Для обеспечения сходимости этого алгоритма 
в работу вступает алгоритм Вернера для получения нового начального приближения. 

Далее описываются алгоритмы построения наилучших чебышевских прибли- 
жений нелинейными выражениями (экспоненциальными, логарифмическими и др.), 
которые сводятся посредством использования вспомогательных функций к алгоритмам 
нахождения полиномиальных приближений с соответствующими весами. 

Алгоритм чебышевского приближения экспоненциальными выражениями вида 


Е, (х; А)= ад ехр(их +...+ ах" ад = 0 (5) 
позволяет находить наилучшее относительное приближение функции Г [а посколь- 
ку выражениями вида (5) обычно аппроксимируют функции, значения которых не 
меняют знак. Наилучшее относительное приближение функции Г (х) аппроксиман- 
том (5) сводится к наилучшему абсолютному приближению вспомогательной функ- 
ЦИИ м] а (х)| полиномом вида 


п 
В (х;В)= У`Ьх (6) 
1=0 
с последующим пересчетом коэффициентов по формулам: 
— коб емо) шт) от) 
1+ ехр (2-р) Ре о. 
где р - величина наилучшего полиномиального приближения [12]. 
Замечание. Точки альтернанса при приближении выражением (5) и полиномом (6) 


совпадают, а величины р и р соответственно наилучших экспоненциального и полино- 
миального приближений равны (с точностью до бесконечно малых высших порядков). 


0 
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Алгоритм равномерного приближения логарифмическими выражениями вида 
Е, (х; А)= т ( +ах+. чад”) (7) 
позволяет находить наилучшее абсолютное приближение, так как выражениями ви- 
да (7) обычно аппроксимируют плавно изменяющиеся функции, которые могут менять 
знак. Наилучшее абсолютное приближение для функции Г (х) аппроксимантом (7) сво- 
дится к наилучшему относительному приближению для вспомогательной функции 


ехр( ий (х)) полиномом вида (6) с последующим пересчетом коэффициентов по формуле: 


В; ии 
а == ( = 0;п). 
52 
1-Р 
Для случая приближения логарифмическими выражениями предыдущее замечание отно- 
сительно чебышевского альтернанса и равенства величин р и Р также справедливо. 


Алгоритм чебышевской аппроксимации корнем целой степени из полинома 


Е (х; А)= ЦИ +ах+...+ах" (8) 


позволяет находить наилучшее относительное приближение для функции Г (х). Как ив 
случаях приближений (5) и (7), приближение нелинейным выражением (8) сводится к 
наилучшей относительной аппроксимации полиномом вида (6) вспомогательной функ- 


ЦИИ [ Иа (х) и квычислению коэффициентов аппроксиманта (8) по формулам: 


1 
2 


Г Е И 
С [+Р) +0-5 

При этом величина р наилучшего относительного приближения аппроксимантом ви- 

да (8) равна Р// (с точностью до бесконечно малых высших порядков) [12]. 
Алгоритм сегментной аппроксимации полиномами предполагает разбиение все- 
го промежутка аппроксимации [,В] на г сегментов и приближение функции Г (х) 
отдельно на каждом 1-м сегменте ( = Г!) полиномом РИ(х) наилучшей равномер- 
ной аппроксимации с величиной наилучшего приближения р; [6]. Величина сегментного 


приближения р определяется по формуле 


Р(<) = тах р,. (9) 


1917 


Обозначим Т совокупность разбиений т={а<1<1<...<1.<р} промежутка 


[©,В] на г сегментов [1,1] ( =1,*). Разбиение г°’={а<#<...<!' < В\, для которого 


Б(="} п#ар(9, (10) 


* 
Г 

Разработанный алгоритм кусочно-полиномиальной сегментной аппроксимации 
позволяет находить приближение с величиной р и узлами разбиения, которые прак- 


* * 
называется оптимальным, а точки й рр Г, — оптимальными узлами. 


22 * 
тически совпадают с величиной Б(т | и оптимальными узлами (10). Алгоритм состоит 


из двух этапов. На первом — определяется минимальное число узлов, при котором 
для величины сегментного приближения р будет выполняться неравенство р<&, 
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где = — заданная погрешность аппроксимации. На втором этапе определяются опти- 
мальные узлы и соответствующее кусочно-полиномиальное приближение. При этом 
используемая в алгоритме процедура определения узлов разбиения является более 
эффективной, чем обычная процедура половинного деления промежутка приближе- 
ния на сегменты. 

Следует подчеркнуть, что применение сегментной аппроксимации для случаев 
замены больших массивов данных позволяет значительно повысить точность прибли- 
жения. В следующем разделе будет показано преимущество сегментной аппроксимации 
по сравнению с аппроксимацией без разбиения на сегменты при сжатии больших мас- 
сивов данных. 

Алгоритм равномерного приближения функций Г(Х ) К переменных Х = =. $ о 


позволяет находить наилучшее приближение с весом у’ =1 обобщёнными многочленами 


п 
Е, (Х;2)=У`2Ф(Х), (11) 
= 
где 1 = (=. Е т по системе линейно независимых базисных функций Фф| (х ),. „Фу Г ) 
на множестве точек Ем = |х (у Е в Задача наилучшей равномерной аппроксима- 


ции многочленами (11) решается как частный случай задачи построения наилучшего в 
чебышевском смысле приближения к решению системы несовместных линейных 
уравнений 


Ф(2)=>' 26, (х0)- 1(х®), (1=1,М), (12) 
7 
т.е. задачи определения такой системы значений параметров 1 = (=. ИЕ ь чтобы 
Ф.(7)] = [И Ш. 1 
пах |Ф, (2) = (2) > п (13) 


Присоединяя к каждой функции Ф,(2 ) её симметрическую копию Фу а ) = -Ф,(2 ), 


задачу (12) — (13) можно представить в виде задачи линейного программирования с 
п-+1 неизвестными и 2М№ ограничениями: 


А=ша, (14) 


вл -оезо (9) а 


Разработанный алгоритм наилучшей чебышевской аппроксимации функции К пе- 
ременных обобщенными многочленами (11) заключается в сведении задачи прибли- 
жения к задаче линейного программирования с ведущей двойственной максимум- 
задачей, которая решается модифицированным симплекс-методом (м.с.-м.) с учетом 
того, что на практике число уравнений значительно больше числа неизвестных и 
таблица «расширенного базиса» при м.с.-м. существенно меньше опорной таблицы при 
использовании прямого симплекс-метода. Данный алгоритм по сравнению с анало- 
гичными позволяет находить наилучшие приближения вида (11) с большей точностью 
и, как правило, за значительно меньшее количество итераций [7]. Этого удалось 
достигнуть за счёт усовершенствования вычислительной схемы алгоритма посредством 
применения приёмов, которые позволяют сократить почти вдвое стандартную симп- 
лекс-таблицу и в процессе решения двойственной задачи м.с.-м. преобразовывать 
только модифицированную (сжатую) симплекс-таблицу, оставляя при этом неизменной 
опорную таблицу. 
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Примеры применения аппарата аппроксимации 


Эффективность разработанного авторами аппарата аппроксимации проверена на 
протяжении многих лет при решении задач математической обработки массивов 
числовых данных в разных областях науки и техники [5]. 

В настоящее время для отечественного суперкомпьютера с кластерной архи- 
тектурой СКИТ создана библиотека процедур вычисления элементарных, гипербо- 
лических и специальных функций, для нахождения наборов коэффициентов наилучших 
чебышевских приближений которых применялся данный аппарат аппроксимации. 
Следует заметить, что полученная при этом точность аппроксимации была не ниже 
10"? при количестве коэффициентов, как правило, не более 10, что значительно 
лучше по сравнению с существующими аппроксимациями другими способами при- 
ближений. 

Для иллюстрации результатов применения аппарата аппроксимации при- 
водятся также примеры сжатия больших массивов данных, которые были получены 
на СКИТ в рамках создания Информационно-аналитической системы «Бюджетный 
комитет». При этом удалось значительно повысить коэффициенты сжатия (1) за счёт 
применения сегментной аппроксимации. Например, в результате сжатия массивов 
(файлов) размерами 3.5 Мб, 4 Мби 7.7 Мб их размеры уменьшились соответственно 
до 24 Кб, 30 Кби 20 Кб с коэффициентами сжатия 125, 140 и 400. 

Ниже на рис. 1 для иллюстрации преимуществ сегментной аппроксимации при- 
водится диаграмма соотношения точностей аппроксимации при сжатии одномерного 
массива-вектора, состоящего из 2000 элементов, с одинаковыми коэффициентами 
сжатия соответственно для случаев целого промежутка и разбиения его на сегменты. 


Погрешность 
аппроксимации (%) 


Коэффициент сжатия 


Е Кусочно-полиномиальная аппроксимацу 


ЕПолиномиальная аппроксимация 


Рисунок 1 — Диаграмма сравнения погрешностей кусочно-полиномиального 
(сегментного) и полиномиального приближений при одинаковых 
коэффициентах сжатия 


Выводы 


Необходимость и важность проблемы аналитического представления потоков 
численной информации определяют особую актуальность разработки методов, алго- 
ритмов и программных средств для его получения. Предлагаемый аппарат аппрокси- 
мации позволяет не только решить эту проблему, но и обладает рядом важных пре- 
имуществ, основанных на реализации способа равномерной аппроксимации, а именно, 
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обеспечивает получение наилучшего равномерного приближения как аналитически, 
так и дискретно заданных функций одной и многих переменных с использованием 
аппроксимантов различных классов с произвольным весом. Повышение эффектив- 
ности применения данного аппарата достигается также за счёт оптимизации алгоритмов и 
программ по точности и быстродействию, что делает его предпочтительнее известных в 
литературе аналогичных работ. Использование на практике на протяжении многих 
лет программных реализаций разработанных алгоритмов аппроксимации на компью- 
терах различных типов, в том числе на суперкомпьютере с кластерной архитектурой, 
подтвердили их высокую эффективность. 
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А.О. Каленчук-Порханова, Л.П. Вакал 

'Апарат апроксимацй у склад! програмного забезпечення суперкомп’ютера з кластерною армтектурою 
У стати! описано розроблен! авторами алгоритми 1 програмн! комплекси найкращо! рвномрно! апроксимацй 
з обгрунтуванням 1х переваг. Для 1люстрацй розглянуто деяк! приклади 1х ефективного застосування 
на практицщь, у тому числ! на суперкомп’ютер! з кластерною архтектурою. 


А.А. Кеепсйик-Рогкйапота, Г.Р. ГаЕи 

АрргохипайНоп Аррагаи$ Сотрозе4 о? ЗоЁууаге ог Зирегсотршег уг Сичег АгсВНесвиге 

п Фе рарег а!еогифил$ апа Бип {ед зой\маге деуеореа Ъу аиогз Юг Без ипПопп арргохипайоп аге ргезещеа 
ап этоипа оЁ Фет адуащасез аге отуеп. Зоте ехатр!ез оЁР Феи ргасйса| аррИсаноп шсадте феи изасе 
Юг зпрегсотрщег зи сазег агсЬИес®@ге аге отуеп. 
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